Sur l'utilisation de LDA en RI pair-à-pair

نویسندگان

  • Sylvie Cazalens
  • Yulian Yang
  • Sylvie Calabretto
  • Esther Pacitti
چکیده

We revisit the problem of defining a peer-to-peer system for Information Retrieval when each peer’s topic-based profile is obtained using Latent Dirichlet Allocation. This method, defined for a centralized collection, provides a rich representation of the topics and of the documents. We describe two ways of using it in a distributed system and analyze their advantages and drawbacks. Then, we illustrate the use of the obtained topic-based profiles within two systems. The first one is unstructured and uses a gossip-based algorithm to obtain dynamic overlays of topically related peers. This requires defining a similarity between profiles. The second one uses super-peers and maintains a topic-based index of the peers, which is recorded in a distributed Hash table. The keys are derived from the topic-based profiles. MOTS-CLÉS : Recherche d’information, systèmes pair-à-pair, Allocation Latente de Dirichlet (LDA).

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Résumé. Les systèmes pair-à-pair (peer-to-peer, P2P, égal-à-égal) se sont popularisés ces dernières années avec les systèmes de partage de fichiers sur Internet. De nombreuses recherches concernant l’optimisation de la localisation des données ont émergé et constituent un axe de recherche très actif. La prise en compte de la sémantique du contenu des pairs dans le routage des requêtes permet d’...

متن کامل

Fouille de données dans les systèmes Pair-à-Pair pour améliorer la recherche de ressources

Résumé. La quantité de sources d’information disponible sur Internet fait des systèmes d’échanges pair-à-pair (P2P) un genre nouveau d’architecture qui offre à une large communauté des applications pour partager des fichiers, des calculs, dialoguer ou communiquer en temps réel. Dans cet article, nous proposons une nouvelle approche pour améliorer la localisation d’une ressource sur un réseau P2...

متن کامل

Dosimetry at high-energy accelerators

R É S U M É Les problèmes de la dosimetric dans les champs de rayonnements ionisants diffusés autour des accélérateurs de haute énergie sont présentés. Après une courte introduction sur l'historique des grandeurs physiques utilisées pour l'acquisition de l'équivalent de dose, les techniques diverses pour la dosimétrie dans des champs mixtes à haute énergie sont décrites, en commençant par des m...

متن کامل

Eléments de caractérisation des environnements des systèmes pair à pair

RÉSUMÉ. Pour évaluer les systèmes pair à pair, il est nécessaire de comprendre les influences qui s’exercent sur eux. Dans cet article nous avons étudié certaines de ces influences d’un point de vue client contrairement au point de vue serveur usuel. Une caractérisation d’un certain nombre de ces facteurs influents tels que l’activité des utilisateurs ou la présence de différents types de fichi...

متن کامل

Fouille au code OCaml par analyse de dépendances

La section 3 présente la construction de ce graphe, enrichie au fur et à mesure des tests et des ré exions. En section 4, nous expliquons comment exploiter ce graphe pour e ectuer les analyses qui nous intéressent, notamment en dé nissant un langage de sélection de sommets (éléments) sur le graphe. En n, la section 5 donne des informations sur l'implémentation de cette analyse dans un outil en ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013